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Titel: 



Verfahren und Vorrichtung 
ftir die Datenverarbeitung 



Beschreibung 

Die vorliegende Erfindung betrifft das oberbegrif f lich Bean- 
20 spruchte und befasst .sich somit mit Verbesserungen bei der 
Verwendung yon rekonfigurierbaren Prozessortechnologien far 
die Datenverarbeitung. 

Verwiesen wird beztiglich des bevorzugten Aufbaus von Lo- 
25 gikzellenfeldern auf die XPP-Architektur und vorverof fent- 

lichte.sowie jtingere Schutzrechtsanmeldungen des vorliegenden 
Anmelders, die zu Of f enbar\angszwecken vollumf anglich einge- 
gliedert sind. Erwahnt seien somit insbesondere. die 
DE 44 15 881 Al, DE 197 81 412 Al, DE 197 81 483 Al, 
30 DE 196 54 846 Al, DE 196 54 593 Al, DE 197 04 044.6 Al, 
/ DE 198 80 129 Al, DE 198 61 088 Al, DE 199 80 312 Al/ 
PCT/DE 00/01869, DE 100 36 627 Al, DE 100 28 397 Al, 
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DE 101 10. 530 Al, DE 101.11 014 A1, PC.T/EP 00/10516, 
EP 01 102 674 Al, .DE 198 .80.128 Al, DE 101 39 170 Al, 
DE 198 09 640 Al, DE 199 26 538.0 Al, DE 100 50 442 Al, sowie 
die PCT/EP 02/02398, DE 102 40 000, DE 102 02 044, . 
DE 102 02 175, DE 101 29 237, DE 101 42 904, DE 101 35 210, 
EP 01 129 923, PCT/EP 02/10084, DE 102 12 622, DE 102 36 271,' 
DE 102 12 621, EP 02 009 868., DE 102 36 272, DE .102 . 41 812, 
DE 102 36 269, DE 102 43 322, EP 02 022 692, ebenso wie die ' 
EP 02 001 331 und die EP 02 027 277. 

Ein Proialem bei herkemmlichen Ansatzen zu rekonf igurierbaren 
Technologies besteht dann, wenn die Datenverarbeitung primSr 
auf einer S'equenziellen CPU unter Hinzuziehung feines konfigu- 
rierbaren Datenverarbeitungslogikzellenf eldes oder derglei- 
.chen erfolgen soli und/oder eine . Datenverarbeitung gewQns.cht 
ist, in der viele und/odef umf angreiche sequenziell auszufah- 
rende Verarbeitungsschritte vorliegen. 

Es sind Ansatze bekannt, die sich damit befassen, wie eine 
Datenverarbeitung sowohl auf einem kohfiguriefbaren Datenver- 
arbeitungslogikzellenf eld als auch auf einer CPU erfolgen 
kann. 

' ' ' ' ■ ' ' ' . 

So ist aus der WO 00/49496 ein Verfahren zum Ausftihren eines 
Computerprogrammes mit einem Prozessor bekannt, der eine kon-' 
figurierbare funktionelle Einheit iimfasst, die in der Lage 
ist, rekonfigurierbare Anweisungen auszufti.hren, deren Effekt 
zur Laufzeit durch- Laden eines Konf igurationsprograinmes rede- 
finiert werden kann, wobei das Verfahren die Schritte xam- 
fasst, dafi Kombinationen rekonf igurierbarer Anweisungen aus- 
gewahlt, ein respektives Konf igurationsprogramm fur jede Kom- 
bination erzeugt und das Computerprograinm ausgeftihrt wird. 
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Dabei soli jedes Mai, wenn eine Anweisung aus einer der Kom- • 
binationen wahrend der Ausfiihrung gebraucht wird und die kon- 
figurierbare funktionelle Einheit nicht mit dem Konf igurati- - 
onsprogramm fur diese Kombination konfiguriert ist, das Kon- "• 
figurationsprogramiri, fiir alle der Anweisungen der Kombination 
in die konf igurierbare funktionelle Einheit geladen werd'en.' 
Weiter ist aus der WO 02/50665 Al eine Datenverarbeitungsvor- 
richtung mit einer konf igurierb'aren funktionellen Einheit be- 
kannt, wobei-die konf igurierbare funktionelle Einheit dazu 
dient, eine Anweisung gemafi einer konf igurierbaren Funktion. 
auszufxihren; Die konf igurierbare funktionelle Einheit weist 
eine Vielzahl von unabhahgigen ■■ konf igurierbaren Logikblocken 
zum Ausftihren programmierbarer . Logikoperationen auf, urn die 
konf igurierbare Funktion zu implementieren. Konf igurierbare 
Verbindungsschaltkreise sind zwischen deri "konf igurierbaren 
Logikblocken und sowohl den Eingangen als auch den Ausgangen 
der konfigurierbaren funktionellen. Einheit. vorgesehen. Dies '•' 
erlaubt eine Optimalisierung der Verteilung von Lbgikfunktio- 
nen tiber die konfigurierbaren LogikblOcke'. 

Ein Prbblem. bei herkammlichen Architekturen besteht dann, 
wenn eine Ankopplung erf olgen soli, und/oder. Technologien wie 
Datastreaming, Hyperthreading, Multithreading und so weiter 
in sinnvoller und Perform:ance steigernder Weise ausgenUtzt 
werden sollen. Die beispielhaft erwahnte Technologie der vor- 
zitierten Nicht-Anmelder-Dokumente zeigt etwa eine Anordnung, 
bei ,der zwar Konf igurationen in ein konf igurierbares Daten- . 
verarbeitungslogikzellenfeld geladen warden konnen, bei wel- 
chen allerdings der Datenaustausch zwischen der ALU der CPU 
und dem konfigurierbaren Datenverarbeitungslogikzellenfeld, 
sei es ein FPGA, DSP Oder dergleichen, iiber die Register er- 
folgt. Mit anderen Worten mtissen Daten aus einem Datenstrom 
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zunachst sequenziell in Register geschrieben warden und dann- 

sequenziell wieder- in diesen abgelegt warden. Auch ist ein 

Problem dann gegeben, wenn ein Zugriff auf Daten von extern 

erfolgen soil, da selbst dann noch Probleme beim zeitlichen 

Ablauf der Datenverarbeitung im Vergleich zur ALU und bei der 

ZuWeisung von Konf igurationeri und so weiter bestehen. Die 

herkommlichen Anordnungen, wie sie aus den Nicht-Anmeldef- 

eigenen Schutzrechten bekannt sind, werden unter . anderem dazu 

verwendet, Funktionen im konf igurierbaren Da.tenverarbeitungs- 

logikzellenf eld, DFP, FPGA oder dergleichen abzuarbeiten, die 

nicht effizient auf der' CPU-eigenen ALU abzuarbeiten sind. 

Pamit wird das konf igurierbare Datenverarbeitungslogikzellen- 

feld praktisch verwendet/ urn benutzerdef inierte Opcodes zu 

ermoglichen, die eine effizient ere Abarbeitung von Algorith- 

men ermOglichen, als dies auf dem ALU-Rechrenwerk der CPU ohne 

konfigurierbare •Datenverarbeitungslogikzellenfeldunterstat- 
zung mSglich ware. 

Im Stand .der Technik ist, wie erkannt wurde, die Ankopplung 
demnach im Regelfall wortbasiert, nicht jedoch blockbasiert, 
wie es zur datenstromenden Verarbeitung erforderlich ware. Es 
ist zunachst Wiinschenswert, eine effizientere Datenverarbei- 
tung zu ermeglichen, als dieis mit einer engen Ankopplung tiber 
Register der Fall ist. 



Eine weitere Maglichkeit zur Verwendung von Lo'gikzellenf el-, 
dem aus grob- und/oder feingranular gebauten Logikzellen und 
■Logikzellenelementen besteht in einer sehr losen Ankopplung 
eines solchen -Feldes an eine herkommliche CPU und/oder ein 
CPU-Kern bei eingebetteten Systemen. Hierbei kann ein her- 
kommliches, sequenzielles Programm auf einer CPU- oder der- 
gleichen laufen, beispielsweise ein in C, C++ oder derglei- 
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Chen geschri'ebehes • Programm., wobei von diesem Aufrufe ei'ner 
Datenstromverarbeitung auf dem fein- und/oder grobgrahularen 
Datenverarbeitungslogikzellenfeld instantiiert werden.. Pro- 
blematisch ist dann, dass beim Programmieren fur dieses Ld- 
gikzellenfeld ein nicht in C Oder einer anderen sequenziellen 
Hochsprache g.eschriebenes Programm far die Datenstromabarbei- 
tung' vorgesehen werden muss. Erw,unscht ware hier, dass; spwohl 
auf der herkoiranlichen CPU-Architekt\ar als auch auf einem mif , 
diesen geitieinsam betriebenen Datenverarbeitungslogikzell^n- 
feld C-Prograitmie oder dergleichen abzuarbeiten sind, das 
-heifit^ dass insbesondere mit.dem Datenverarbeitungslogikzel- 
lenfeld in quasi sequenzieller Prograiranabarbeitung dennoch 
.eine Datenstromf ahigkeit erhalten bleibt, wahrend simultan ' 
auch insbesondere moglich bleibt, dass ein CPU-Betrieb in 
nicht zu loser Ankopplung moglich ist. Es ^ist auch beireits 
bekannt, innerhalb einer, Datenverarbeitungslogikzellenf eldan- 
ordnung^ wie sie insbesondere aus PACT02 (DE 196 51 075.9-53, 
WO 98/26356), PACT04 (DE 196 54 846.2753, WO 98/29952), • 
PACT08, (DE 197.04 728.9, WO 98/35299) • PACT13 (DE 199-26 
538.0, WO 00/77652) PACT31 (DE 102 12 621.6-53, PCT/EP 
02/10572) bekannt ist, auch eine sequenzielle Datenverarbei- 
tung innerhalb .des Datenverarbeitungslogikzellenf eldes vorzu- 
sehen. Hierbei wird dann allerdings innerhalb einer einzelnen 
Konfiguration, beispielsweise. um Resso.urcen zu sparen, eine 
Zeitoptimierung zu erzielen und so weiter, eine partielle Ab- 
arbeitung erzielt,- ohne dass diese bereits dazu fuhrt, dass • 
ein Programmierer ein Stuck Hochsprachencode autoinatisch 
leicht.ohne weiteres auf ein Datenverarbeitungslogikzellen- 
feld umsetzen kann, wie dies bei herkommlichen Maschinenmo- 
dellen -fiir sequenzielle Prozessoren der Fall ist. Die Umset- 
zung von Hochsprachencode auf Datenverarbeitungslogikzellen- 
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f elder hach Prinzipien der Modelle ftir sequenziell arbeitende 
Maschinen ist- weiterhin schwierig. 

Aus deiu Stand der Technik ist waiter bekannt, dass • mehrere. 
Konfigurationen, die eine jeweils unterschiedliche Funktions- 
weise von Arrayteilen bewirken, simultan auf dem. Prozessor- 
feld (PA) abgearbeitet. werden konnen und dass ein, Wechsel von 
einer oder einigen der Konf iguration (en) ohne gtQrung ahderer 
zur Laufzeit erfolgen kann. Es sind' Verf ahren und in Hardware 
implementierte Mittel zu deren Urns etzung bekannt, wie sicher- 
gestellt werden kann, dass dabei ein Abarbeiten von auf das ' 
Feld zu ladenden Teilkonf igurationen ohne. Deadlock erfolgen 
kann- Verwiesen wird hierzu insbesondere auf die die FilmoT- 
Technik betref f enden-, Anmeldungen PACT05 (DE 196 54 593.5-53, 
WO' 98/31102) PACTIO (DE 198 07 872-2, WO '99/44147 , WO 
99/44120) PACT13 (DE 199 26 538.0, WO' 00/77 652 ) , PACT17 (DE 
100 28 397.7, WO 02/13000). Diese Technologie ermoglicht in 
gewisser Weise bereits eine- Parallelisierung., und, bei ent- 
sprechender Gestaltung und Zuofdnung der Konf igurationen, 
auch eine Art Multitasking/Multithreading und zwar dergb- 
stalt, dass eine Planung, das heifit ein Scheduling und/oder 
eine Zeitnutzungsplariungssteuerung vorgesehen ist. Es sind 
also aus deiti Stand der Technik schon Zeitnutzungsplanungs- 
steuerungsmittel und -verf ahren per se bekannt, die, zumin- 
dest unter ent sprechender Zuordnung von Konf igurationen zu 
einzelnen Aufgaben und/oder Faden zu Konf igurationen und/oder 
Konfiguratlonsfolgen, ein Multitasking und/oder Multithrea- 
ding erlauben. Die Verwendung solcher Zeitnutzungsplanungs- 
steuermittel, die iiti Stand der Technik zur Konf igurierung 
und/oder Konf igurationsverwaltung verwendet wurden, zu Zwek- 
ken des Scheduling von Tasks, Threads, Multi- und Hyper- , 
threads wird. per se als erfinderisch angesehen.- 
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Wtinschenswert ist auch zumihdest gemaii einem Teilaspekt in • 
bevorzugten Varianten, moderne Technologien der Datenverar- 
beitung und Prograinmabarbeitung wie Multitasking, Multithrea- 
ding, Hyperthreading unterstQtzen zu.konnen, zumindest in be- 
vorzugten Varianten. einer Hdlbleiterarchitektur . 

Der Grundgedanke der Erfindung besteht darin, Neues far die 
•gewerfaliche Anwendung bereitzustellen. 

Die .L6sung dieser Aufgabe wird in unabhSngiger Form bean- 
sprucht. Bevorzugte Ausfuhrungsformen finden sich in den Un- 
teransprtichen . 

Ein erster wesentlicher Aspekt der vorliegenden Erf indung ' ist 
somit darin zu sehen, dass deiti. Datenverarbeitungslogikzellen- 
feld Daten im Ansprechen auf die Ausftihrung einer Ladekonf i- 
guration durch das . Datenverarbeitungslogikzellenfeld zuge- 
ftihrt werden und/oder Daten aus diesem Datenverairbeitungslo- 
gikzellenfeld weggeschriebert (STORE) werden, indem eine 
STORE-Konfiguration entsprechend- abgearbeitet .wird. Diese La- 
de- uhd Oder Speicherkonfigurationen sind dabei bevorzugt 
derart -auszugeatalten, dass innerhalb des Datenverarbeitungs- 
logikzellenfeldes direkt oder indirekt Adressen jener .'Spei- 
cherstellen generiert werden, • auf welche ladend und/oder 
speichernd direkt oder indirekt zugegriffen werden soli. Es 
ist durch diese- Einkonf iguration von Adressgeneratoren inner- 
halb einer Konf iguration mSglich, eine Vielzahl von Daten in 
das Datenverarbeitungslogikzellenfeld' einzuladen, wo sie ge- 
gebenenfalls in internen Speichern (iRAM) ablegbar sind 
und/ Oder wo sie in internen Zellen. wie EALUs mi't Registern 
und/oder dergleichen eigenen Speichermitteln' abgelegt werden 
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konnen. Die Lade- beziehungsweise Speichefkonf iguration er- 
mSglicht somit ein blpckweises • und nahezu datenstromartiges, 
insbesondere. gegenUber Einzelzugrif f vergleichsweises schnel- 
. les Laden von Daten und es kann eine solche Lade-Konf igura- 
tion ausgefuhrt werden vor einer oder mehreren tatsachlich 
Daten auswertend und/oder verSndernd abarbeitenden Konfigura- 
tion(en), mit welcher/n clie vorab geladenen Daten verarbeitet 
werden.' Das Datenladen kann dabfei typisch bei groBen Logik-- 
zellenfeldern in kleinen Teilbereichen derselben geschehen, 
wahrend andere Teilbereiche mit anderen' Aufgaben bef aBt sind,. 
Bei d&r in anderen verof f entlichten Dokumenten des Anmelders 
beschriebenen Ping-Pong-artigen Datenverarbeitung, bei der 
auf beiden Seiten.eines Datenverarbeituhgsf eldes Speicherzel- 
len vorgesehen sind, wobei die Daten in einem ersten Verar- 
beitungsschritt von dem Speicher' auf der 'elnen Seite durch 
das Datenverarbeitungsfeld zvim Speicher auf der anderen Seite 
stromen, dort die beim ersten FelddurchstrOmen erhaltenen ' 
Zwischenergebnisse im zweiten Speicher abgelegt Werden/ gege- 
benenfalls das Feld iraikonfiguriert wird, die Zwischenergeb- 
nisse dann ftir die Weiterverarbeitung zuruckstromen usw., 
kann etwa eine Speiehers.eite durch eine LOAD-Konf iguration in 
einem Array-Teil mit neuen Daten, vorgeladen werden, wShrend 
aus der gegeniiberliegenden Speicherseite Daten mit einer 
STORE-Konf iguration in einem anderen Array-Teil weggeschrie- 
ben werden- Dieses simultane LOAD/STORE -Vorgehen ist im tibri- 
gen auch ohne rSumliche Speicherbereichstrennung moglich. 

Das Laden kann insbesondere aus einem Cache "und in diesen ' 
hinein erfolgen. Dies hat die Vorteile, dass die externe Kom- 
munikation mit grafieren Speicherbanken fiber den Cachecontrol-r 
-l.er gehandhabt wird, ohne dass innefhalb des Datenverarbei- 
tungslogikzellenfeldes separate Schaltanordnungen daftir vor- 
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gesehen sefn miissen, dass der Zugriff in lesender oder- 
schireibender Weise bei Cache-Speichermitteln typisch sehr. 
.schnell und mit allenf alls geringer Latenzzeit erfolgen wird 
und dass auch typisch eine CPU-Einheit , dort typisch uber ei- 
ne separate LOAD/STORE-Einheif, an diesen Cache angebunden 
ist^ sodass ein Zugriff auf Daten und ein Austausch derselben 
zwischen CPU-Kern und Datenveirarbeitungslogikzellenf eld 
blockweise schnell und derart erfolgen kapn, dass nicht ftjr • 
jedes Obergeben von Daten ein separater Bef ehl etwa • aus dem 
OpCode-Fetcher der CPU abgeholt und verarbeitet werden' muss - 

Es erweist sich diese Cacheankoppelung auch als wesentlich 
gunstiger als eine Ankopplung eines Datenverarbeitungslo- 
gikzelienfeldes an die ALU uber Register, wenn diese Register 
nur liber eine LOAD/STORE-Einheit mit eine'ra: Cache koramunizie- 
ren, wie dies aus den Nicht-PACT-eigenen zitierten Schriften 
per se bekannt ist. *• 

Es kann eine weitere Datenverbindung zu der Lade/Speicher- 
einheit der oder einer dem Datenverarbeitungslogikzellenf eld 
zugeordneten Sequenziell-CPU-Einheit vorgesehen sein und/oder 
zu deren Register. 

*■ ' 
Es sei erwahnt, dass eiri. Ansprechen derartiger .Einheiten uber 
separate Eingangs-Musgangsanschlusse. (lO-Ports) der insbe- 
sondere als VPU beziehungsweise XPP ausgestaltbaren Datenver- 
arbeitiingslogikzellenanordnung erfolgen* kann und/oder durch 
einen oder mehrere einem Einzelport nachgeschaltete Multiple- 
xer. 

Dass neben dem insbesondere blockweisen und/oder streamenden 
und/oder im Random-Access, insbesondere im RMW-Modus (Read- 
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•^Modify-Write-^Modus) ' erfolgenden Zugriff auf Cache-Bereiche in 
schreibender und/oder lesender Weise und/oder die LOAD/STORE- 
Einheit und/oder die (per se im Stand der Technik bekannte) 
Verbindung mit .dem Register der Sequenziell-CPU auch eine 
Verbindung itiit einem externen Massenspeicher wie einem RAM, 
einer Festplatte ■ und/oder einem anderen Datenaustauschport 
wie einer Antenne und so weiter erfolgen kann, sei auch er- 
wahnt- Es kann fUr diesen Zugriff auf Cache- und/oder LOAD/ 
STORE -rEinheit- und/oder registereinheitverschiedene Speicher- 
iaittel eih separater Port vorgesehen sein. Dass hier geeigne- 
te Treiber, Signalaufbereiter fiir Peg^lajipassung und so wei- 
ter vorgesehen sein konnen/ sei erwah'nt. Im Obrigen sei er- 
wahnt, dass irisbesondere, jedoch nicht . ausschlieBlich zur* 
Aufbereitung eines in das Datenverarbeitungsiogikzellenf eld 
hineinstJTomenden oder in diesem stromendeiY Datenstrom die Lo- 
gikzellen des Feldes ALUs bzw. EALUs iimfassen konnen und ty- 
pisch werden, denen eingangs- und/oder ausgangsseitig, insbe- 
sondere sowohl eingangs- als auch ausgangsseitig kurze, fein- 
granular konf igurierbare, FPGA-artige Schaltkreise vorgesetzt 
sein- kOnnen, urn ^etwa. aus einem kontinuierlichen Datenstrom 
Vierbitbiacke herauszuschneiden, wie dies fur die MPEG-4- 
Dekodierung erforderlich ist. Es istdies zum einen vorteil- 
haft, wehn ein Datenstrom. in die Zelle hineingelangen soil 
und dort ohne Blockierung von grOBeren PAE-Einheiten einer 
Art Vorverarbeitung zu unterwerfeh ist. Dies ist auch dann 
von ganz besonderem Vorteil, wenn die ALU als SIMD-Rechenwerk 
ausgestaltet ' wird^ wobei dann ein sehr breites Dateneingangs- 
wort von zum Beispiel 32 Bit Datenbreite uber die vorgeschal- 
teten FPGA-artigen Streifen aufgespalten wird in mehrere pa- 
rallele DatenwSrter von zum' Beispiel 4 Bit Breite^ ciie dann 
±n den .SIMD-Recheriwerken parallel abgearbeitet werden kQnnen, 
was die Gesamtperformance des Systems signifikant zu erhOhen 
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vermag^ sofern entspjrechende Anwendung benotigt werden. Es 
sei darauf hingewiesen, dass vorstehend von FPGA-artigen vor.- 
beziehungsweise nachgeschalteten Strukturen die Rede war. Mit 
FPGA-artig muss aber^ was explizit .erwahrit sei, nicht zwin- 
gend Bezug genommen sein auf J-Bit-granulafe Anordnungen. Es - 
ist insbesondere m6glich, .statt dieser .hyperf eingranularen . 
Strukturen : lediglich feiner granulare Strukturen von ' zum' Bei- 
spiel . 4 Bit Breit'e vo.rzusehen. Das heilit, die FPGA-artigen 
Eingangs- und/oder Ausgangsstrukturen vof und/oder nach einer 
insbesondere .als SIMD-Rechenwerk ausgestalteten ALU-Einheit . 
sind so konfigur'ierbar, dass iininer 4 Bit bre'ite' DatenwQrter 
zugeftihrt' ' und/oder verarbeitet werden. Es ist moglich, hier 
eine Kaskadierung vbrzusehen, so dass zum Beispiel die ein- " 
kommenden 32 Bit breiten Datenworter in 4 separierte bzw. se- 
parierende 8-Bit-FPGA-artige, riebeneinand^r angeordnete 
Strukturen stromen, diesen 4 Stuck 8 Bit breiten FPGA-artigen 
Strukturen ein zweiter Streifen mit 8 Stuck 4 Bit breiten 
FPGA-artigen Strukturen nachgesetzt ist, und gegebenenf alls 
nach einem weiteren derartigen Streifen dann, sofern dies fiir 
den jeweiligen Zweck als erforderlich erachtet wird, • zum Bei- 
spiel 16 Stuck parallel nebeneinander angeordnete 2 Bit brei- 
te FPGA-artige Strukturen vorgesehen werden. Wenn dies der 
Fall ist, kann .gegenttber rein hyperfeingraniilar FPGA-artigen 
Strukturen- eine betrSchtliche Verringerung des Konfigura- 
tionsaufwandes erzielt werden. Dass dies liberdies dazu ftihrt, 
dass' der Konf igurations'speicher und so weiter der . FPGA- 
artigen Struktur wesentlich kleiner ausfallen kann und somit 
eine Einsparung an Chipflache erzielt wird, sei erwahnt. 

Prinzipiell sind die vorstehend bpschriebenen Kopplungsvor- 
telle bei Datenblockstromen- uber den Cache prinzipiell er- 
reichbar; besonders- bevorzugt ist es jedoch, wenn der Cache 
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streifenweise (slice-artig) aufgebaut ist und dann ein Zu-' 
griff auf .mehrere der Slices simultan erf olgen .kann, insbe- 
sofidere auf alle Slices gleichzeitig. Dies ist danri vorteil- 
haft, wenn, was noch er5rtert warden wird, auf dem' Datenver- 
arbeitungslogikzellenfeld (XPP) und/oder der Sequenziell-^CPU 
und/oder den Sequenziell-CPUs. eine Vielzahl Von -Threads abzu- 
arbeiten. sind, sei es im Wege des Hyperthreadings, des Multi- 
taskings ufid/oder des Multithreadings. ETs sind also bevorzugt 
Cachespeichermittel mit Scheibenzugrif f bzw.. Scheibenzu- 
griffsermeglichungssteuermitteln vorgesehen. Es kann dabeiz. 
B. jed^ Thread eine elgene Scheibe- zugeordnet werdeh. Dies, 
ermOglicht es spater, ■ b'eim Abarbeiten der Threads sicherzu- 
stellen, dass jeweils auf die entsprechenden Cachebereiche' 
bei Wiederaufnahme der mit dem Thread abzuarbeitenden Be- . 
fehlsgruppe zugegriffen wird. ' 

Es sei noch einmal erwahnt, dass der Cache nicht zwingend in 
Slices unterteilt sein muss, und dass, wenn dies der Fall 
ist, nicht zwingend jeder Slice einem eigenen Thread zugewie- 
sen werden muss. Es sei allerdings darauf hingewiesen, dass 
•dies die bei weitem bevorzugte Methode ist. Es sei weiter 
darauf hingewiesen, dass es Falle geben kann, in denen nicht . 
alle Cache-Bereiche simultan oder zu einer gegebenen Zeit 
temporSr benQtzt werden. Vielmehr ist zu erwarten, dass bei 
typischen Datenverarbeitungsanweridungen, wie sie in handge- 
haltenen mobilen Telefonen (Handys) , Laptops, Kameras und so 
weiter auf treten werden, h'aufig Zeiten vorl'iegen werden, in 
denen nicht der gesamte Cache' benStigt wird. Es ist daher be- 
sonders bevorzugt, wenn einzelne Cache-Bereiche von der Lei- 
stungsversorgung derart trennbar sind, dass ihr Energiever- 
brauch signifikant absinkt, insbesondere auf oder nahe null. 
Dies kann bei sliceweiser Ausgestaltung des Caches durch sli- 
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ceweise Abschaltung derselben ulper geeignete Leistungsab- 
trennmittel gescheheri. Die Abtrennung kann. entweder aber eine 
Heruntertaktung, Taktabtrennung oder eine Leistungsabtrennung' 
erfolgen- Es kann insbesondere einer einzelnen Cache-Scheibe 
Oder dergleichen eine Zugrif f serkennung zugeordnet sein, wel-- 
che dazu ausgebi'ldet ist^t zu erkennen,. ob ein jeweiliger 
Cache-Bereich beziehungsweis'e eine- jeweilige Cache-Scheibe 
momentan einen .ihm zugeordneten Thread, Hyperthread oder Task 
hat, von welchem er benutzt wird. Sofern dann vom Zugrif f ser- 
kennung smitt el festgestellt wird, dass dies nicht der Fall 
ist, wird typisch eine- Abtrennung voifi 'Takt ' und/oder sogar der 
Leistung moglich sein. Es sei erwahnt, dass bei Wiederein- 
.schalten der Leistung nach einem Abtrennen ein sofortiges 
Wiederansprechen des Cachebereiches moglich ist, also keine 
signifikante Verzogerung durch das An- urid Ausschalten der 
Leistungszuf uhr zu erwarten ist, sofern mit gangigen geeigne- 
ten Halbleitertechnologien eine Implementierung in Hardware 
erfolgt. 



20 Ein weiterer bpsonderer Vorteil, dersich bei der vorliegen- 
den Erfindung ergibt,- besteht darin, dass zwar eine. besonders 
ef fiziente Kopplung beztiglich des Obertrags. von* Daten bezie- 
hungsweise Operandenin insbesondere blockweiser Form gegeben 
ist, dass* aber dennoch ein Balancing nicht in der Weise er- 
25 forderlich ist, dass die exakt gleiche Verarbeitungszeit in 

Sequenziell-CPU und XPP beziehungsweise Datenverarbeitungslo- 
gikzellenfeld erforderlich ist . Vielmehr erfolgt die Verar- 
beitung in einer praktisch oftmals unabhangigen Weise, insbe- 
sondere der art, dass die Sequenziell-CPU und die Datenverar- 
30 beitungslogik^ellenf eldanordnung far. einen Scheduler oder 
dergleichen als separate • Ressourcen betracHtbar sind. Dies 
erlaubt eine sofortige Umsetzung bekannter Datenverarbei- 
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tungsprograinmauf spaltungstechnologien wie Multitasking, Mul- 
tithreading und Hyperthre'ading. Der sich ergebende Vorteil, 
dass' ein Pf adbalancing nicht erforderlich ist, fiihrt dazu, * 
dass beispielsweise in der Sequenziell-CPD beliebige Anzahlen 
von Pipelinestufen durchlaufen werden konnen, Taktungen in 
unterschiedlicher Weise mogliche sind und so weiter. Ein wei- 
terer Vorteil der ■ vorliegend^n Erfindung besteht darin, dass 
'durch das 'Hinei'nkonf igurieren einer Ladekonf iguratibn bezie- 
hungsweise einer Storekonf iguration in das XPP oder andere 
Datenverarbeitungslogikzelldnfelder die Daten in das Feld mit 
einer Geschwindigkeit hineingeladen werden oder aus diesem 
hefausgeschrieben werden k5nnen, die nicht mehr bestimmt ist 
durch die Taktgeschwindigkeit der CPU, die Geschwindigkeit, 
mit welcher der, OpCode-Fetcher arbeitet, oder dergleichen. * 
Mit anderen Worten ist die Ablauf steuerurig der Sequenziell- • 
CPU nicht mehr f laschenhalsartig begrenzend fur den Daten- 
durchsatz des Datenzellenlogikf eldes, ohne dass eine nur noch 
lose Ankopplung besteht. 

Wahrend es in einer besonders bevorzugten Variante.der Erfin- 
dung moglich ist, die fiir, eine XPP-Einheit bekannte CT (bzw. 
CM; Konfigura-tionsmariager bzw. Konf igurationstabelle) zu ver- 
wenden, um sowohl .das Konf igurieren eines oder mehrerer,. auch 
hierarchisch mit mehreren CTs angeordneter XPP-Felder und 
gleichzeitig eines oder mehrerer Sequenziell-CPUs, dort quasi 
als Hyperthreading-Hardwareverwaltung zu verweriden, was den 
inharenten Vorteil hat, dafi bekannte Technologien wie FILMO 
usw, fur die hardwareunterstiit zte Verwaltung beim'Hyperthrea- 
ding einsetzbar werden, ist es alternativ und/oder, insbeson- 
dere in hierarchischer ' Andrdnung, zusatzlich moglich, .dass 
ein Datenverarbeitungslogikzellenfeld wie eine XPP Konfigura- 
tionen vom OpCode-Fetcher einer Sequenziell-CPU- tiber das Ko- . 
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prozessor-Interface erhait. bies fahrt dazu, dafi' von der Se- 
. .quenziell-CPU und/odef eiher anderen XPP ein Aufruf instanti- 
iert werden kann, der zu einer . Datenabarbeitung auf der XPP 
ftihrt. Die XPP wird dabei dann z. B. tiber die beschriebene 
Cache-Ankopplung und/oder .mittels, LOAD- und/oder STORE-, 
Konfigurationen, die Adressgeneratoren .fiir Laden und/oder 
Wegschreiben von Daten im XPP- bzw. Datenverarbeitungslo- 
.gikzellenfeld vorsehen, im Datenaustausch .gehalten. Mit ande- 
ren Worten wird eine Koprozessor-artige Ankopplung eines Da- 
tenverarbeitungslogikzellenfeldes mOglich, wShrend gleichzei- 
tig ein datenstromartiges Datenladen durch' Cache- urid/oder 
J/O-Port-JCopplung-' erfolgt. 

, Es.sei erwahnt, dali die Kpprozes'sor-Ankopplung, d. h. die An- 
15 kopplung des Datenverarbeitungslogikzellerff eldes typisch dazu 
. fiihren wird, dafi das Scheduling auch fiir dieses Logikzellen- 
feld auf der Sequenziell-CPU Oder einer dieser ubergeordneten 
Schedulereinheit bzw. einem entsprechenden Schedulermittel 
erfolgen wird.' In einem solch4n Fall findet praktisch die ' 
20 Threading-Kontrolle und -verwaltung auf dem Scheduler' bzw. 
der Sequenziell-CPU statt. Obwohl dies per se. moglich ist,.' 
wird dies, zumindest bei einfachster Implementierung der Er- 
findung, nicht zwingend der Fall 'sein. Vielmehr kann eine 
Verwendung des Datenverarbeitungslogikzellenf eldes durch Auf- 
25 ruf in herkpjmmlicher Weise wie bei einem ^tandard-Koprozessor 
etwa bei 8086/8087-Kombinationen 'erfolgen. 

Weiter sei erwahnt, dafi es in einer besonders bevorzugten Va- 
riante, unabhangig- von der Art der Konf iguration, sei es iiber 
das Koprozessor-Interface, den als Scheduler mitdienenden 
Konfigurationsmahager (CT) der XPP bzw. des Datenverarbei- 
tungslogikzellenf eldes Oder dergleichen oder auf andere Wei-' 
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se, moglich ist, im bzw, unmittelbar am Datenverarbeitungslo- 
gikzellenf eld bzw« unter Verwal'tung des Datenverarbeitungslo- 
gikzellenf eldes Speicher, insbesondere interne Speicher, 'ins- 
besondere' bei der XPP-Architektur, wie sie aus den diversen 
Vorahmeldungen u'nd den Verof f entlichungen des Anmelders be- 
kannt ist, RAM-PAEs/ odef andere entsprechend verwaltete oder 
interne Speicher wie ein. Vektorreg'ister anzusprecheri, d. h. 
die iiber die LOAD-Konf iguiration eingel.adenen Datenmengen vek- 
torartig wie in Vektorregistern in die internen Speicher ab- 
zulegen, dann, nach Uinkonf igurieren der XPP bzw. des Daten-- 
verarbeitungslogikzellenf elde&v also Oberschreiben bzw. Nach- 
laden und/oder Aktivieren einer neuen Konf iguration^ die die 
eigentliche Verarbeitung der Daten durchfiihrt (in diesem Zu- 
saininenhang sei darauf hingewiesen, daJ5 fur eine solche Verar- 
beitungskonf iguration auch Bezug genoimneri ^warden kann auf ei- 
ne Mehrzahl von Kpnf igurationen, die z. B. iiti Wave-Modus 
und/oder sequenziell nacheinander abzuarbeiten sind) zuzu- ' 
greifen wie bei einem Vektorr'egister und dann die dabei er- 
haltenen Ergebnisse und/oder Zwischenergebnisse wiederum in 
die internen oder liber" die XPP wie interne Speicher verwalte- 
ten.externeh Speicher,. um dort diese Ergebnisse abzulegen. 
Die so vektorregisterartig mit Verarbeitungsergebniss.en be- 
schriebenen Speichermittel unter XPP-Zugriff sind dann, nach 
Rekonf igurieren der Verarbeitungskonf iguration durch Laden ' 
der STORE-Konf iguration in . geeigneter Weise w.eggeschrieben, 
was * wiederiom datenstromartig geschieht, sei es iiber den 1/0- 
Port (4irekt in externe Speicherbereiche und/oder, wie beson- 
ders bevorzugt/ in Cache-Speicherbereiche, auf welche dann .zu 
einem spateren Zeitpunkt die Sequenziell-CPU und/oder andere 
Konfigurationen. auf der, zuvor die Daten erzeugt habenden XPP 
od.er einer anderen entsprechehden Datenverarbeitungseinheit 
zugreifen kSnnen. 
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Eine besonders bevoxzugte Variants besteht darin^ zumindest 
fur bestimmte Datenverarbeitungsergebnisse und/oder Zwischen- 
ergebnisse als Speicher- bzw. Vektorregistermittel, in wel- 
chem bzw. welches die erhaltenen Daten abzulegen. sind, nicht* 
einen internen Speicher zu benutzen, in welchen Daten tiber 
eine STORE-Konf iguration in den Cache— pder einen anderen Be- 
reich, auf welchen die Sequenziell-CPU oder eine andere Da- 
tenverarbeitungseinheit zugreifen konnen, wegzuschreiben 
sind, sondern statt dessen unmittelbar die Ergebnisse wegzu- 
schreibeh in entsprechende;. irisbesondere zugrif f sreservderte 
Cachebereache, die insbesopder'e Slice-artig organisiert sein 
konnen. Dies, kann gegebenenf alls den Nachteil einer grofieren 
Latenz haben^ insbesondere wenn die Wege zwischen der XPP- 
Oder Datenverarbeitungslogikzellenf eldeiriheit und dem Cache 
so lang sind,- dafi die. Signallauf zeiten ins Gewicht fallen^ ' 
fuhrt aber dazu, . daJi gegebenenf alls keine weitere STORE-r 
Konf iguration benotigt wird. Es sei im iibrigen erwahnt^ dafi 
eine derartige Abspeicherung von Daten in Cache-Bereiche ei- 
nerseits, wie vorstehend beschrieben, , dadurch moglich ist, • 
dafi der Speicher^ in; welchen geschrieben wird^ physikalisch 
nahe beim Cache-Controller liegt und als Cache ausgestaltet 
ist, dass aber alternativ und/oder zusatzlich auch die Mog- 
lichkeit besteht, einen Teil e.ines XPP-Speicherbereiches, 
XPP-lnternen Speichers oder dergleichen, insbesondere bei RAM 
liber PAEs unter die Verwal^tung eines oder, nacheinander meh- 
rerer Cache-Speichercontroller zu stellen. • Dies hat dann Vor- 
teile, wenn die Latenz beim Abspeichern der Verarbeitiingser- 
gebnisse, welche innerhalb des Datenverarbeitungslogikzellen- 
feldes bestimmt werden, gering gehalten werden soil, wahrend. 
die Latenz beim Zugriff auf den dann nur noch als ,>Quasi- 
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Cache^^ dienenden Speicherbereich . durch andere Einheiten .hicht 
Oder nicht signifikant ins Gew.icht fallt, 

Es sei im abrigen erwahnt, daii auch eine Ausgestaltung derart 
mc3glich ist, daJ5 der Cache-Controirer einer herkornmlichen Se- 
quenziell-CPU einen Speicherbereich als • Cache - anspricht/ der, 
ohne dem Datenaustausch mit dem DatenverariDeitungslogikzel- ■ 
lenfeld zu dienen, auf und/oder bei diesem physikalisch 
liegt. Dies hat den Vorteil,.daB dann, wenn Anwendungen auf 
dem .Datenverarbeitungslogikzellenf eld lauf en, die einen al- 
lenfalls geringen iokalen Speicherbedarf haben, .und/oder wenn 
auch nur wenige weitere Konf iguratiohen. bezogen auf die zur 
Verfiigung stehenden Speichermengen benotigt warden, dies.e ei- 
,rier Oder mehreren Se.quenziell-CPUs als Cache zur Verfugung 
stehen konnen. Es se.i erwahnt, daii dann d^r Cache-Controller 
fur die Verwaltung eines Cache-Bereiches mit dynamischem Um-. 
fang, d. h- variierender GroBe ausgebildet sein kann und ' 
wird. Eine dynamsiche Cache-Umf angsverwaltung bzw. Cache- 
Umfangsverwaltungsmittel fur die dynamische Cache-Verwaltung 
wird typisch die Arbeitslast auf der * Sequenzieli-CPU und/oder 
dem Datenverarbeitungslogikzellenf eld b^rucksichtigen* Mit 
anderen Worten kann beispielsweise analysiert werden, . wie 
viele NOPs in einer gegebenen Zeiteinheit auf der Sequenzi-. 
ell-CPU vorliegen und/oder wie viele Konf igurationen im XPP- 
Feld in daifur vorgesehenen Speicherbereichen vorabgelegt sein 
sollen, um eine schnelle Umkonf iguration, sei es im Wege ei- 
ner Wellenrekonfiguration Oder auf andere Weise. Die hiermit ■ 
offenbarte dynamische Cachegrosse ist dabei insbesondere be- 
vorzugt lauf zeitdynamisch, d. h . der ' Chacecontroller verwal- 
tet jeweils eine aktiielle Cachegrosse, die sich von Takt zu 
Takt Oder Taktgruppe Sndern kann. Es sei im ubrigen darauf 
hingewiesen; daB die ziigrif f sverwaltung eines XPP-. bzw. Da- 
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tenverarbeitungslbgikzellenfeldes itiit Zugriff als interner 
Speicher ,wie bei einem Vektbrregister und als Cache--artiger *• 
Speich^r fur: den externen Zugriff was die Speicherzugrif f e' 
angeht bereits beschrieben wurde in' der DE 196 54 595 und dei 
PCT/DB 97/03013 (PACT03) . Die genannten Schriften sind durch 
Bezugnahme zu Of f enbarungszwecken* hiermit vollumf Snglich ein 
gegliedert. 

Vorstehend wurde auf Datenverarbeitungslogikzellenf elder Be-^ 
zug genoitimen^ die insbesondere zur Laufzeit rekonfigurierbar 
sind.,Es wurde diskutiert, dass bei diesen eine Konfigurati- 
onsverwaltungseinheit (CT bzw. CN) vorgesehen werden kann, 
Aus den diversen, zu Of f enbarungszwecken unter Bezug genoirmie- 
nen Schutzrechten des Anmelders sowie seinen weiteren Verof- 
fentlichungen ist die Verwaltung von Konf igurationen per se 
bekannt, Es sei nun explizit darauf hingewiesen, dass derar-' . 
tige Einheiten und deren Wirkungsweise, mit der insbesondere 
unabhangig yon Ankopplungen an Se'quenziell-CPUs etc.'. aktuell 
noch nicht benotigt'e Konf igurationen vorladbar sind, auch 
sehr gut nutzbar sind, urn im Multitaskingbetrieb und/oder bei 
Hyperthreading und/oder Multithreading einen Task- bezie- 
hungsweise einen Thread- und/oder Hyperthreadwechsel zu be- 
wirken. Dazu. kann ausgenUtzt werden/ dass wahrend.der Lauf- 
zeit eines Threads. Oder Tasks in die Konfigurat ions speicher 
bei einer einzelnen oder einer Gruppe von Zellen des Daten- 
verarbeitungslogikzellenf eldes/ also beispielsweise einer PAE 
eines PAE-Feldes (PA)' auch Konf igurationen fur unterschiedli- 
che' Aufgaben, das heiJit Tasks oder Threads beziehungsweise ' 
Hyperthreads geladen werden konnen. Dies fuhrt dann dazu, 
dass bei einer Blockade eines Tasks oder Threads, etwa wenn 
auf Daten gewartet werden muss, well diese noch nicht verfug- 
bar sind, sei es, da sie von einer anderen Einheit noch nicht 
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generiert oder empfangen wurden, beispi.elsweise auf Grund von 
Latenzen, sei es, well eine Ressource derzeit noch durch ei- 
nen anderen Ziigriff blockiert ist, dann- Konfigurationen ' fur 
einen anderen Task oder Thread vorladbar und/oder vorgeladen 
sind und auf dies© gewechselt werden kann, ohne dass der 
Zeitoverhead fiir einen Konf igurationswechsel bei der insbe- 
sondere schattengeladeneri Konf iguration abgewartet werden 
muss, wahrend es prinzipieil mQglich ist, diesfe Technik auch 
dann zu. verwenden, wenn innerhalb eines Tasks die wahrschein-r 
lichste Weiterfahrung vorhergesagt wird und eine Vorhersage- 
nicht zutrifft (prediction miss), Wird diese ■.Art des Betriebs 
bei vorhersagefreiem Betrieb bevorzugt sein. Bei Verwendung 
mit einer rein sequentiellen CPU und/oder mehrereA rein se- 
quentiellen CPUs wird somit durch die Zuschaltung eines Kon- 
figurationsmanagers eine HyperthreadingverWaltungshardware • 
realisiert. Verwiesen sei hinsichtlich dessen insbesondere 
auf PACTIO (DE 198 07 872.2, WO' 99/44147, ' WO 99/44120). Dabei 
kann es als ausreichend erachtet werden, insbesondere • dann, 
wenn nur fiir eine CPU und/oder einige wenige Sequenziell-CPUS' 
eine Hyperthreadingverwaltung gewunscht ist, auf bestimrate, 
in den speziell unter Bezug genommenen Schutzrechten be- 
schriebene Teilschaltungen wie den FILMO zu vexzichten. Ins- 
besondere wird damit die Verwendung der dort beschriebenen 
Konfigurationsmanager mit und/oder ohne FH,MO.far die Hyper- 
threadingverwaltung- ftir eine und/oder mehrere rein sequenzi- 
ell arbeitende CPUs mit oder ohne Arikopplung an eine XPP oder 
ein anderes Patenverarbeitungslogikzellenf eld offehbart und 
hiermit fQr sich beansprucht'. Es wird hierin eine fiir sich 
erfinderische Besonderheit gesehen. Es sei im Obrigen er- 
wahnt, dass eine Vielzahl von CPUs realisiert werden kann mit 
den. bekannten Techniken, wie sie insbesondere aus PACtSl (DE- 
102 12 621.6-53, PCT/EP 02/10572) bekannt sind, • bei welchen 
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innerhalb eines Arrays- eine oder mehrere Sequenziell-CPUs 
aufgebaut werden unter Ausnutzung eines oder inehrerer Spei- 
cherbereiche insbesondere. iiti Datenverarbeiturigslogikzellen- ' 
feld fur den Aufbau der sequenziellen CPU;, insbesondere als 
Befehls- und/o(der Datenregister • .Auch sei darauf verwiesen^ 
dass bereits in f ruber en' Anmeldungen wie PACT02, (DE 196 51 
075-9-53, WO 98/26356), PACT04 (DE 196 54 846.2-53, WO 
98/29952), PACTP8, (DE 197 04 728,9, WO 98/35299) offenbart 
wurde, wie Sequenzer mit Ring- und/oder Wahlf rei-Zugrif f- 
Speichern aufgebaut werden konnen. 

Es* sei darauf hingewiesen, 'dass ein Task- beziehungsweise 
Thread- und/oder Hyperthreadwechsel unter . Verwendung der be- 
kannten CT-Technologie derart erfolgen kann und bevorzugt 
auch erfolgen wird, dass eineiti per se bekarnnten, Software- 
implementierten Betriebssystem-Scheduler oder dergleichen von 
der CT Perf ormance-Scheiben iind/oder Zeitscheiben zugeordnet 
werden, wahrend welchen bestimmt- wird, von welchen Tasks oder 
Threads nachfolgend welche Telle per se, unterstellt, dass 
Ressourcen frei sind, abzuarbeiten sindi Dazu sei ein Bei- 
spiel wie folgt gegeben: Zunachst soil- fiir einen ersten Task 
eine Adressfolge generiert werden, gemaB w'elcher wShrend der 
AusfUhrung einer LOAD-Konf iguration Daten aus einem Cache- 
Speicher, an dem ein Datenverarbeitungslogikzellenf eld in der 
beschriebenen Weise • angekoppelt ist, gelad'en werden sollen. 
Sobald diese Daten vorliegen, kann mit der Abarbeitung einer 
zweiten, der eigentlichen DatenverarbeitUngskonf iguration, 
begonnen werden. Auch diese kann. vorgeladen werden, da sicher 
feststeht, dass diese Konf iguration, sofern keine interrupts 
Oder dergleichen einen vollstandigen Taskwechsel erzwingen, 
auszufuhren ist. In herkommlichen Prozessoren ist nun das 
Problem des sogenannten Cache-Miss bekannt, bei- dem die Daten 
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zwar ailgef oirdert werden, , aber nicht im Cache far den Ladezu- 
griff bereit liegen. Tritt ein solcher Fall in einer Kopplung 
gemaB der vorliegenden Erfindung auf ^ kann bevorzugt auf ei- 
nen anderen Thread, Hyperthread und/oder Task gewechselt wer- . 
5' den, der insbesondere zuvor yon dem insbesondere softwareim- 
plementi'erten Betriebssystem-Scheduler und/oder einer anderen 
hard- und/oder sof twareimplementierten, entsprechend wirken-' 
den Einheit f ur " eine nachstfnogliche Ausfuhrung bestimmt wurde 
[ • und demgemaB bevorzugt yorab in einen der verftigbaren Konf i- 
10 gufationsspeicher des Datenverarbeitungslpgikzellenf eldes 

insbesondere im Hintergrund wShrend ^der Ausfuhrung einer an- 
deren Konfiguration,' beispielsweise der LOAD-Konf iguration, 
welche das Laden jener Daten, auf die nun gfewartet wird, be- ■ 
wirkt hat, geladen wurde. Das fur die Vorabkonf iguration un- 
15 gestort von der tatsachlichen Verschalturig der insbesondere 
grobgranular ausgebildeten Datenverarbeitungslogikzellen des 
Datenverarbeitungslogikzellenfeldes separate Konf igurations- 
leitungen von der . konf igurierenden Einheit zu den jeweiligen 
Zellen direkt und/oder tiber geeignete Bussysteme gefuhrt sein 
20 konnen wie per se im Stand der Technik bekannt, sei hier .noch 
einmal explizit erwahnt, da diese Ausbildung hier besbnders ■ 
bevorzugt ist, vim ein ungestortes Vorabkonf igurier en ohne 
StSrung einer anderen, gerade laufenden Konf iguration zu er- 
mOglichen. Wenn dann die Konf iguration, auf welche wahrend 
25 beziehungsweise auf Grund des Task-Thread- und/oder Hyper- 
threadwechsels gewechselt wurde, abgearbeitet wurde, und 
zwar, bei bevorzugten nicht teilbaren, " ununterbrechbaren und 
somit quasi atomaren Konf igurationen bis zum Ende abgeabeitet 
wurde, wird teilweise eine weitere andere Konf iguration wie 
30 vorbestimmt durch die entsprechenden Scheduler, insbesondere 
den betriebssystemartigen Scheduler festgelegt, abgearbeitet 
und/oder jene Konf iguration, zu welcher zuvor die zugehorige 
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LOAD-Konfiguration ausgefiihrt wurde. Vor der Ausftihrung einer 
Verarbeitungskonf iguration, zu welcher zuvor eine LOAD- 
Konf iguration ausgefuhrt wurde, kann insbesondere abgetestet 
werden, ob mittlerweile die entsprechenden Daten in das Array 
eingestromt sind, also die Latenzzeit, wie sie typisch auf- 
tritt, verstrichen ist und/oder die Daten tatsSchlich vorlie- 
gen. 

Mit anderen Worten werden dann Latenzzeiten, wenn sie auft re- 
ten, weil z. Korifigurationen noch nicht einkonf iguriert 
Bind, Daten noch nicht geladen und/oder Daten noch nicht weg- 
geschrieben wurden, Oberbriickt- und/oder verdeckt, indeiti 
-Threads, Hyperthreads und/oder Tasks ausgefuhrt werden, wel- 
che schon vorkonf igurierf sind und welche mit Daten arbeiteh, 
die schon verfugbar sind beziehungsweise die an Ressourcen 
weggeschrieben werden konnen, die fiir das Wegschreiben be- 
reits zur Verfugung stehen. Auf diese. Weise werden Latenzzei- 
ten weitgehend liberdeckt und es .wird, eine hinreichende An- 
zahl von per se auszuf ahrenden Threads, Hyperthreads und/oder 
Tasks unterstellt, eine praktisch 100%-ige Ausnutzung des Da- 
tenverarbeitungslogikzellenf eldes err.eichf. 

Mit dem beschriebenen System bezuglich Datenstrom-Fahigkeit 
bei gleichzeitiger Ankopplung an eine Sequenziell-CPU und/ 
Oder bezuglich de^: Ankopplung eines XEP-Array beziehungsweise 
Datenverarbeitungslogikzellenfeldes und simultan einer Se- 
quenziell-CPU an eine geeignete Schedulereinheit wie einen 
Konfigurationsmanager oder dergleichen lassen sich insbeson- 
dere ohne -weiterea echtzeitf ahige Systeme realisieren. Zur • 
Echtzeitf ahigkeit muss, gewahrleistet sein, dass auf eintref- 
fende Daten beziehungsweise Interrupts, die insbesondere das 
Dateneintreffen signalisieren, innerhalb einer in keinem Fall 
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zii Oberschreitenden Maximalzeit reagiert werden kann. Di6s'. 
kann beispielsweise geschehen durch einen. Taskwechsel auf ei- 
nen Interrupt hin -und/oder, beispielsweise bei priorisierten 
Interrupts, durch. Festlegung, dass ein gegebener Interrupt 
momentan zu ignorieren ist, wobei. auch dies innerhalb einer 
bestiininten z'eit festzulegen ist. Ein Taskwechsel bei derarti- 
• gen echtzeitf ahigen Systemen wird typisch auf "drei .Arten er- 
•f olgen" konnen, namlich entweder dann, wenn 4in, Task eine" be- 
stimmte Zeit gelaufen ist (Watch-dog-Prinzip) , bei . Nichtzur- 
verfagungstehen einer RessourceV sei es durch deren Blockade 
durch anderen Zugrif f oder auf grand von' Latenzen beim Zugrif f 
darauf, insbesondere in schreibender und/oder lesender Weise, 
das heifit be,i Latenzen von Datenzugrif fen und/oder beim Auf- • 
treten von Interrupts. 

* vr 

Mit der vbrliegenden Erfindung kann die Echtzeitfahigkeit ei- 
nes Datenverarbeitungslogikzellenfeldes nuninehr erreicht wer- 
den, indem eine oder mehrere von drei moglichen Varianten im- 
plement iert wird. 

Eine erste Variante besteht darin, dass innerhalb einer von • 
dem Scheduler beziehungsweise der CT ansprechbareii Res source • 
ein Wechsel zur Abaxbeitung beispielsweise eines Interrupts 
erfol^t.. Sofern die Ansprechzeiten auf Interrupts oder andere 
.Anforderungen so grofi sind, =dass wahrend dieser Zeit eine 
Konf iguration • ohne Unterbrechung noch abgea.rbeitet werden " 
kann,. ist dies unkritisph, zumal wahrend der Abarbeitung der 
aktufell laufenden Konf iguration auf jener Ressource, die ftir 
die Abarbeitung des Interrupts zu wechseln ist, eine Konfigu- 
ration zur Interruptabarbeitung vorgeladen werden kann. Die 
Auswahl der vorabzuladenden Interrupt -bearbeitenden Konf igu- 
ration ist z. B. durch die CT durchzuf lihren . Es- ist m6glich. 
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dieiLaufzeit der Konf iguration auf der far die Interruptbear- 
beitung f reizugebenden bzw. zu wechselnden Res source zu be- 
grerizen. Verwiesen wird dazu auf PACT29/PCT (PCT/DE03/000942) . 

-Bei Systemen, die schneller auf Interrupts reagieren mvissen, . 
kann es bevorzugt sein, eine einzelne Ressource, also bei- 
spielsweise eirie- separate XPF-Einheit und/oder Telle eines. • 
XPP-Feldes fUr eine solche Abarbeitung zu reservieren. Wenn 
dann ein schnell abzuarbeitender Interrupt auftritt, kann " 
entweder eine- fUr besonders kritische' Interrupts schon vorab 
vorgeladene Kohfigur'ation abgearbeitet werden oder es wird 
sofort mi-t dem Laden einer Interrupt behandelhden Konfigura- 
tion in die reservierte RessourcJe begonnen. Eine Auswahl der 
jeweils far den entsprechenden Interrupt erforderlichen Kon- 
f iguration ist durch entsprecKende Trigg^rung, Waveabarbei- 
^ tung usw. itiQglich. 

Es .sei im Obrigen erwahnt, dass es mit den schon beschriebe- 
nen Methoden ohne weiteres moglich ist, eine instantane Reak- 
tion auf einen Interrupt zu erhalten,. indem uber die Verwen- 
• dung von LOAD/STORE-Konf igurationen eine Code-Reentranz er- • 
reicht wird. Hierbei wird nach jeder datenbearbeitenden Kon- 
figuration oder zu gegebenen Zeiten, beispielsweise' alle fanf 
Oder zehn Konfigurationen eine STORE-Konf iguration ausgefahrt, 
und dann eine- LOAD-Konf iguration unter Zugriff auf jene Spei- 
cherbereiche ausgefUhrt, in die zuvor weggeschrieben wurde. 
Wenn sichergestellt wird, dass. die von der STORE-Konf igura- 
tion- benutzten Speicherbereiche so lange unberahrt bleiben, 
bis durch Fortschreiten im Task eine weitere Konfiguration ' > 
samtliche relevanten Inf ormationen (Z'ustSnde, Daten) wegge- 
schrieben hat, ist sichergestellt, dass bei Wiederladen, also 
Wi4dereintritt in eine zuvor bereits , begonnene, • aber nicht zu , 
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Ende gefiihrte Konfiguration oder Konf igurationskette wieder " " 
dieselben Bedingungen erhalten .werden. Eine solche Zwischen- 
schaltung von LOAD/STORE-Konfigurationen unter simultanem " . 
Schutz von ndch nicht. veralteten STORE-Speicherbereichen " 
lasst sich-automatisch ohne zusatzlichen Programmieraufwand 
sehr' einfach. generieren, z. b. von einem Compiler, port kann 
die Ressourcenreservierung gegebenenfalls vorteilhaft sein. 
Das bei der Ressourcenreservierung und/oder in anderen Fallen 
• auf zumindest eine Mange ho6hpriorisierter .Interrupts durch 
Vorabladen von bestiinmten Konfigurationen reagiert werden 
kann, sei nqch einitial e'rwahnti 

Eine . weitere, besonders bevorzugte Variante der Reaktion auf 
Interrupts besteht dann, wenn zumindest eine der ansprechba- 
ren Ressourcen eine Sequenziell-CPU ist,, darin, auf dieser 
eine Interrupt-Routine abzuarbeiten, in welcher wiederum Code 
fur das Datenverarbeitungslogikze.llenfeld verboten ist. Mit 
anderen Worten wird eine Interrupt-Routine ausschlielilich auf 
einer Sequenziell-CPU abgearbeitet, ohne dass XPP-Datenverar- 
beitungsschritte aufgerufen werden. Dies garantiert, dass der • 
Verarbeitungsvorgang auf dem Datenverarbeitungslogikzellen- 
feld nicht, zu unterbrechen ist und es kann dann eine Wei- ' 
terabarbeitung auf diesem Datenyerarbeitungslogikzellenf eld 
nach einem Taskswitch erfolgen. Obwohl •damit die eigentliche 
Interrupt-Routine keinen XPP-Code besitzt, kann.dennoeh dafiir ' 
gesorgt werden, dass auf einen Interrupt bin zu einem spate- 
ren, nicht mehr echtzeitrelevanten Zeitpunkt mit der XPP auf 
einen durch einen Interrupt und/oder eine Echtzeitanforderung 
erfassten Zustand und/oder Daten unter Verwenduhg des Daten- 
verarbeitungslggikzellenfeldes reagiert werden kann. • 
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Patentansprache 

Dat'enverarbeitungsvorrichtung mit einem Datenverarbeitungslo- 
gikzellenfeld undvziomindest einer Sequenziell-CPU, dadurch 
gekennzeichnet;, da:ss eine Ankopplung der Sequenziell-CPU und 
des Datenverarbeitungslogikzellenfeldes ziom Datenaustausch in 
insbesondere blockweiser Form durch zu einem Cache-Speicher 
fuhrende Leitungen moglich ist. 
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Verfahren und Vorrichtung 
far die Datenverarbeitung 



Zusammenf assung 



Die .Erfindung betrlfft eine Datenverarbeitungs vorrichtung mit 
einem Datenverarbeitungslogikzellenf eld . und zumindest einer 
Seguenziell-CPU. Hierbei ist vorgesehen, dass eine Ankopplung 
der Sequenziell-CPU und des Datenverarbeitungslogikzellenf el- 
des zuiri Datenaustausch in insbesondere blockweise.r Form durbh 
zu einem Cache-Speicher , f Qhrende Leitungenmoglich is±. 
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